Поиск   Случайная задача
Подборки   Языки   Авторы   Явления
Логин:
Пароль:
    Регистрация     Восстановить пароль

Назад
Найдено задач: 1
№1605 (А. А. Сомин; 2017)
В компьютерной лингвистике N-граммами называют последовательности из N слов подряд. По данным Национального корпуса русского языка, включающего в себя тексты разных жанров и стилей (от официально-делового до разговорного), размером более 600 миллионов слов, три самых частых 2-граммы (биграммы) — это последовательности и не, и в и потому что, а три самых частых 3-граммы (триграммы) — это о том что, в том что и до сих пор. Среди 4-грамм второе место занимает в том числе и, а среди 5-грамм на четырнадцатом месте находится последовательность есть не что иное как. Ниже приведён алфавитный список слов, образующих двадцать из наиболее частых 6-грамм по данным Национального корпуса русского язык… >>